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nl^nfniTJl^^ P erformances d '"" Systeme multiprocesseur comprenant une 
file d attente de travaux et architecture de systeme pour la mise en oeuvre du JSl 



(57) L'invention concerne un procede d'affectation 
de taches dans un systeme de traitement de donnees 
numeriques multiprocesseur a systeme Sexploitation 
preemptif et une architecture pour la mise en oeuvre de 
ce procede. Le systeme comprenant des processeurs 
(200-203 et 210-21 3) susceptibles de traiter les taches 
en parallels repartis en groupes (200-201, 202-203) 
Une file d'attente elementaire (5 a , 5 6 ) est associee a 
chacun des groupes de processeurs (200-201 
202-203) et enregistre des taches a executer. Toutes les 
taches a executer (T, a r 10 ) sont enregistrees dans une 
table (4). Chacune des taches (7^ a 7 10 ) de la table (4) 
est associee a I'une des files d'attente (5 a , 5 6 ) et chacu- 
ne des taches enregistrees dans les files d'attente (5 , 
5 b ) est associee a I'un des processeurs (200 a 201 ). Les 
associations sont effectuees par des jeux de pointeurs 
croises ( P200 a p 203 , PP 5 a , ppS^ pT„ P T 5 , p r 10 , Psa1 a 
P5*4» Psb\ a P56io)- Dan s un mode de realisation sup- 
plemental, selon plusieurs variantes, on procede a un 
(re-)equlibrage de la charge du systeme entre files d'at- 
tente elementaires. 
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cesseurs a Tune des files d'attente elementaires. 

[001 5] Cette disposition permet notamment de limiter (e nombre de processeurs accedant aux verrous et done de 
limiter le phenomene de contention 

[001 6] Cependant. ['experience montre que. lorsque le nombre de taches et le nombre de processeurs augmentent 
la disposition precitee ne permet plus d'ameliorer les performances du systeme. 
[001 7] Ceci est du a plusieurs phenomenes et notamment aux suivants : 

[0018] Dans un systeme d'exploitation moderne existent deux types de taches ■ les taches a priorite variable et les 
taches a priorite f.xe. Les taches du premier type sont des taches dont la priorite varie en fonction du temps de pro- 
cesses consomme (la politique d'ordonnancement est definie par le systeme d 'exploitation lui-meme) Les taches du 
second type sont des taches dont la politique d'ordonnancement est fixee lors de la definition de la tache par le oro- 
grammeur. K 

[001 9] En premier lieu, la gestion des taches de priorite fixe dans un systeme comportant plusieurs files d'attente 
selon une premiere caracteristique du premier mode de I'invention, peut devenir complexe, car il est necessaire d'eviter 
qu une prendre tache de priorite plus elevee soil executee apres une seconde tache de priorite moins elevee Cette 
gestion savere en effet difficile, et surtout couteuse en temps, lorsque les deux taches precitees sont dans deux files 
d attente distinctes. On conceit a.sement que cette difficulty augmente rapidement avec le nombre de taches qui se 
repartissent dans un grand nombre de files d'attente. 

[0020] Le probleme subsiste pour des taches de priorite variable, mais la difficufte de mise en oeuvre est moindre 
on ^ZtT ' e systeme d ' ex Plo»ation lui-meme qui fixe les priorites, et il peut se permettre de violer ses propres regies 
[0021] En second lieu, le traitement des taches peut devenir desequilibre. Les taches etant, a priori de natures 
hSterogenes, le temps necessaire au traitement de celles^i peut varier dans de fortes proportions d'une tache a I'autre 
II sensuit que un ou plusieurs processeurs, ou groupes de processeurs, peuvent se trouver en sous-charge voire 
devenir inact.fs, faute de taches a trailer (les files d'attente associees s'etant videes), alors qu'un ou plusieurs autres 
processeurs, ou groupes de processeurs. continuent de trailer des taches (voire etre surcharges) et qu'il reste des 
taches a exdeuter dans les files d'attente associeos a ceux-ci. Aussi, dans un second mode de realisation prefere de 
I invention, tout en conservant les dispositions propres au premier mode de realisation (partition des files d'attente) 
on procede k un reequilibrage du traitement des tSches, selon plusieurs variantes. 

[0022] Selon une premiere variante, le reequilibrage comprend une repartition optimisee des taches entre les diffe- 
rentes files d'attente du systeme. Le mode de repartition tient compte de difterents parantetres qui seront precises 
dans ce qui suit. La repartition peut etre effectuee. soil lors de la creation de la tache. soit lors de I'association realisee 
entre la tache et un fichier contenant le programme a ex6cuter. 
[0023] A litre d'exemple. dans un environnement de type "UNIX' precite, cette association est realisee par une ins- 
truction de type : 'exec(T. Cette seconde option est preferable lorsque le systeme multiprocesseur est du type "NUMA' 
precite. 

3S [0024] Cette disposition ameliore les performances du systeme, y compris lorsque le nombre de taches a trailer est 
res eleve. Cependant, la courbe representant les performances presents des oscillations, qui traduisent des instabi- 
lity, notamment lorsque le nombre de taches devient eleve. En outre, il est encore possible d'ameliorer les perfor- 
mances. *" 
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[0025] Selon une deuxieme variante de realisation du second mode, lorsque la file d'attente associee a un proces- 
seur, ou a un groupe de processeurs. devient vide et que le processeur ou au moins Pun des processeurs n'a plus de 
tache en cours de traitement. le processeur recherche dans les autres files d'attente s'il existe des taches en attente 
de traitement. S. cette recherche est positive, dans un mode prefer6, le processeur recherche ce qu'on pourra appeler 
la me.lleure tache a trailer", s'il existe plusieurs taches en attente. Le mode de recherche et de selection de cette 
tache sera precise dans ce qui suit. 
4* [0026] On doit bien comprendre que dans ces deux variantes, I'affectation des diff6renles taches aux differentes 
files d attente reste mchangee. L'association des premiere et deuxieme variantes precitees est particuli&rement efficace 
pour I amelioration des performances du systeme tant que de nouvelles taches se creent en permanence Par contre 
lorsque eel etat cesse, par exemple en fin de travail du systeme, on peut etre amene a constater de nouveau des 
desequilibres de charge. 

so [0027] Aussi, I'invention peut comprendre une troisieme variante de realisation, dans laquelle on reaffecte des taches 
entre differentes files d'attente, de facon periodique par exemple. 

[0028] Cette disposition n'a g^neralement que peu d'effet en regime normal (creation continue de taches) sur les 
performances d'un systeme multiprocesseur symetrique, e'est-a-dire du type "SMP" precite. Elle peut cependant seve- 
rer utile pour un systeme de type "NUMA" prScite. 

[0029] L'invention a done pour objet un procede d'affectation de taches dans un systeme de traitement de donnees 
numenques multiprocesseur, a systeme Sexploitation preemptif, comprenant un nombre determine de processeurs 
susceptibles de trailer lesdrtes taches en parall&le, caracterise en ce qu'il comprend au moins une phase preliminaire 
pendant laquelle lesdrts processeurs sont repartis en groupes. chaque groupe comprenant des nombres predetermines 
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[0039] Un mecanisme dit "de verrou" est utilise dans un certain nombre de circonstances. pour eviter un acces 
concurrent a une tache. et notammen, (orsqu'une tache est ajou.ee ou retiree de .a rile d'attente 5. ou lorsqlle change 

^L,ST?°] aiS§me " t qUB . 06 mecanisme de verrou Slobal soil generates de contentions lorsqu'il est frequem- 

ZL^iSXFZZS^ ,aible sca,abili,e - Ce1 inconveniem es « amp, * e lorsque 18 ™£!2SCr 

u^Li,fnn SS J;L e 'n "? e H Caract6ris,ic " Je importante de Pinvention. dans un premier mode de realisation on prevort 
et deCous 6nte UmqUe ' " dSS Verr ° US qUi ' Ui SOnt asS0ciSs ' en p,usieurs -n^nbto. de file tfaCe 

[0042] La figure 2 illustre schematiquement un exemple d'architecture de ce type. Le systeme 1 comorend comme 
Zf^T P ' US,eUrS pr °f esseurs Cependant. ces processeurs ont ete rassemblesen groupes^SesseTs 
par exemple tro.s groupes references G a a G Chaque groupe. G a a G e , peut ccmprendre un nombre Kntoue ou 

pri s^r? 20 " 21" S To^G °" 3 ^ "«^-ni - 9-upe "com r2 de 

p^esseurs, 20 et 2 le groupe G„ tro.s processeurs, 20 b a 22 6 , et le groupe un seul processes. 20, 

h v P , fem,ere ca racteristique importante de Invention, la file d'attente unique figure 1 5) 

6o a ffu nTmhr« H * " ,eS d " atten,e ° 8 plus prec,se encore ' Ie nombre de J.es d attente es 

iSi^T t 9rOUf l e f proCesseurs - soi « tro * files d'attente dans I'exemple de la figure 2 : 5 a a 5 chaque file 
d attente etant associee a Tun des groupes de processeurs G a G 01 

IK?. »^«"2T n au,re aspect importam ' chaque * cheT ri * r - est affect6e a une fi,e p arti - 

Se jeux aSSOCiati ° nS S ' eWeC,Uent C ° mme ' 16 "™ m ««* ^ « ^ard de ,a figure 4, a 

b^xLrim^ 2 n ° mbre ^ 9rOUP6S dS processeurs ' el d °"c du nombre de files elemental, depend de nom- 
oeToT^ ll Un H Syste ™ ^"'tiprocesseur de caracterisliques donnees. Genera.ement, cette repartition ^ 
, ! 6 Par dSS CalCU ' S P rea,able s. mais par I'experimentation et la mesure 

h-, w q ^ t 8 fiXS |,invention est d'augmenter les performances globales du systems par le biais d'une meilleu- 
Z T T, T TJ ntta prOC6SS6urs individuels. Aussi. les experimentations et tests prLes cSZ ls 
iSETVST es f27 Pr ° 9 T meS d ° ,SSt St dS f8ferenCe - dftS '^hmark- se'lon ,a termino o^anglo 
hZ t Jf- f ! U,6r Par 16 SySt8me La ^partition des processeurs en groupes associes a des files 
dat ente elemental donnant les mei.leurs resultats. d'un point de vue performances esfretenuH ce s Se La 

S& Testl a e r r ri 9 ( f r n / ra,ement " 9e ' 8e " 61 UtMiSee P ° Ur ISS SyS,6meS de mSme structure fabriquLparfa suite 
r 1 I ? i Presumer que. a pr/b/* les meilleures performances devraient etre atteintes en associant 

une file d'attente a chacun des processeurs. En d'autres termes. chaque groupe serail r£S?STli^^S^ 
ss r^r^ir rt,t, ° n t PeUt 8n9endrer deS difficu,tes de re ^»n. Aussi. un compromis est %£££fiZ^ 

JSom ependant ' COmme " 3 ete indic ' ue - les architectures des systemes multiprocesseurs du type °NIUMA° ac- 

irEEKsra^ rcrr ce et rappe,er brievement ies —«-««- 

40 J,? 511 L u $ySt6me 1 6St diViS6 en modules . P ar temple en deux modules, M, et M comme represente sur la fioure 
3 (ce nombre pouvant itre quelconque). Chaque module, J* et M,. comprend un nombre quSoSJ^jSilSS 

a quatre . 200 a 203 et 210 a 21 3, respectivement. En effet, lorsque le nombre de processeurs en parallels auamente 
45 ll P hr i° r T CeS J dU , SyS,8me 9' obal augmentent tout d'abord sensiblement lineairement, puis la cou me s inS^ Le 
cZt, q r, I' I" ? Pr6S8me 6n 96nera ' Une Val6Ur ° ptirT,ale - Les P^cesseurs de chaque module^ e M, sont 
mTZrl Lnf ? m ' m ° dUleS ' 60 61 ^ res P^ivement, et chaque module comprend notemment une 

sJsZ^ h " S5 T" t ? tyP8 ° SMP " PreCi,B LSS modules ' * A*,, son, relics entre euxpa unTen f eTun 
so SSST ^ ' 1 ° 2 qU ' cons,i,uent un Prolongement des bus internes precites 

I^n L^r/r 50 ' 1 3 em qUe ' Par 6Xemp,e ' 13 l6CtUre OU |,6crtture d ' une don " ee d « °" dans une memoire externe 
raTJTi f. ' ? ^ prOC6SSeur de ce module ' ^ traduise par une degradation des performances d 37 a 
dT Q P r°l ? , at ' 0n enmremeni ex6cutee a Pinterieur dun meme module. Les performances sent JgaTemen 

?T*rz^:%£™z ^::T er d ' un moduie & rautre par ,e nen - - p - 9 — ~ 

55 f« S31 K-. AU . SSi " °1 3 Pr ° POSe d6S P rocedes Permettant d'obvier tout ou partie des probldmes specifiques oos6s oar 
£JT % de ,yPS " NUMA "' PrOCSd6s qui sortent du c adre precis de .'invention s P ec ^ ues P°ses par 

^n,l\ ^TT: ' e , PrOC8de dS r ™ enlion - d ans son premier mode de realisation, puisqu'il perme, de limiter les 
oontenfions, du fart de la partrtion des files d'attente e, des verrous associes. trouve une application parfbuSlrnem 
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chacune des files d'attentes, respectivement 5 a et S b : et T,-T 4 pour la file d'attente 5 et T a T «t r 

deposition n est pas toujours env.sageable. C'est le cas par exempts torsqu'un processus comprend des taches Ses 

J a rr, S Ct ^ ,3Che d ° il al ° rS " Sider d3nS 19 file d " attente associee a ce Processeur ou au groups uquel 
il appament. L ordre des pnontes est trails a I'interieur de cette file d'attente 

[0070] En resume de ce qui vient d'etre decrit. le precede selon I'invention, dans le prem.er mode de realisation aui 
consiste a dernu.t.p.ier les files d'attente. a affecter cheque file d'attente a un groupe de piS^mTTSXJ 
cheque teche a une f.le d'attente permet bien d'ame.iorer les performances globlles du systeme E effe let clten 
t.ons sont redu.tes. car les verrous sont egalement distribues 

flnT; ' e Pr °f d6 Pern ! et ' daPS Une arcni,ec,ure de -NUMA- dimplanter un mecanisme dit de "Weak 
1h ! term ' nol °9'e anglo-saxonne. Un tel mecanisme favorise ('execution d'une tache sur un processeur 

aZ?, n niqUe ' C . 6 qU ' Permet dS tifer Un P ' US 9rand benef,cie de la memoire ca <*« <*e de "nivsa 3" assocfi 
au module. Or, pu.squ'.l est possible d'associer une file d'attente a des processeurs appartenant a un seul module^ 
distnbuteur peut a.sement confiner les laches d'un processus dans un seul module ' 
t0072j Le precede selon le premier mode de realisation trouve cependant des limites lorsque le nombre de laches 
V? prOCesseurs au 9™ntent tenement. En effet. lors de .a creation "physique" d'une ihe ceTeS S 
etre affec ee a 'une des files d'attente du systeme, en faisan, usage d'un mecanisme de distributTon donnt uSou a 
present , ,. a ete suppose imp.icitement que la distribution des laches etai. rea.isee sur une bas^- -qui^aSon 
tempore.le entre les differentes files d'attente, dans la mesure ou elles ne sont pas pleines Pour ce Jai re on oZ 
u.,l,ser un algorithms bien connu du type "round robin", e'est-a-dire a tour de r6le Une te.le m^£Z£££ 

^ enel ^ COnditi ° nS Pr6ci,6eS ' 168 ,ScheS P r6sentant des caraceristiques non homogVnes 
notamment en ce qui concerns le temps de traitement necessaire, il peut arriver qu'une ou piusieurs files d'^ente 
seen, vides ou peu chargees, et done que les processeurs des groupes qui .eur sont associes soient en sous^harql 
vo.re macttfs pour le moms jusqu'a I'apparition de nouvelles taches e. a .eur affectation a ces files Ittent E sens 
inverse, une ou p.usieurs au.res files d'attente peuvent presenter des surcharges importantes II apparent done un 
phenomene de desequ.hbre de charges, qui a d'autant plus de chance de se produire que ,e nombre de fi es rfattente 
e. le nombre de taches a trailer sont e.eves. L'augmentation escomptee des performances globa.es ^^du systeme e2 
alors contrebalancee par ce phenomene parasite. Dans certains cas particu.ierement defavorab.es auXsuTd'un 
seu, donne de charge de travail, seui. qui depend des resources propres a un systeme particu.ier, il arrive d constat 
que les dispositions du precede de I'invention sont contre-productives, en ce sens que les perfonroTes du tvSZ 

W^usT^T Ce " eS T dS rart C ° nnU Pr6sen,ant 165 mames ressources 'nforma'ques 
™ IL£T f , S6C ° nd m ° de dS realisa,ion ' mode d * realisation prefers, susceptible de piusieurs varian.es 
on adopte des dispositions supplemental permettant un (re-)equi.ibrage de la charge entre les Rentes f tes 
d attentes, ou pour le mo.ns un traitement optimise des taches reparties dans les files d'attente. de manie e a ce aue 
les processeurs so.ent utilises de facon optimisee. On doit bien comprendre cependant que, selon^ second mode 

HZ n« VarianteS " ' eS dis P° si1ions P r °P res ■« P^ier mode sont conserves Notammem on 

epartrt les processeurs en groupes (qui peuvent cofneider avec une repartition en modules dans un sSe S 
ecture de type NUMA ) et on prevoit piusieurs files d'attente, une par groupe de processeurs 
0074] Les operates necessaires pour obtenir cette configuration a files d'attente multiples, generalement effec 

- I Z Z^rZ « ' r^r,' ^ PhaS ^ US '" 0n P ° Urra < ua,ifi8r de P-liminaire. EnmSe LpTa^ne, 
un (re-)equ,l.brage des taches entre f.les d'attente ou de la charge de travail entre processeurs va etre obtenuTeton 
irons mecamsmes, constituent pr 6 cis 6 ment trois variantes du second mode de reaction. II doit «SS!^E/ES 
que ces ,ro,s mecan^smes peuvent coexister e, ne son, pas exc.usifs .'un de .'autre. Tout au contraire dans Z 
de rea sanon prefere on cumulera ces trois mScanismes, pour le moins les deux premiers qui donnenHes meZrs 

so ™ ^ ° bjeCt,fS P° ursuivis P ar Invention, comme il le sera precise ci-apres 

* ?" f P, !« i§r6 V8rian,e de realisa,ion - u " ^quilibrage des taches est obtenu en les repartissant de facon 
opt m,s6e entre les differentes files d'attente lorsqu'e.les apparaissent "physiquement", et non plus s^pZentl tour 

^S, ( T, IT P - eC,te) - 13 ,a5 ° n Pr60iSe dS ° h0isir Une fi,e d ' attente va etr e precisss cypres 
Stien^ SL?h?2!i 7 Vafiante d ! r6a ' isation ' un reequiiibrage du traitement des taches est obtenu en op.imisant 
ss TIT , ! 1 prOCeSSeurs - Lors ^' url P-ocesseur detecte que .a file d'attente qui lui est associes est vSe 
I o q onle a n Zl * , T ^ " Va chercher une ^ a ^ **ns une autre file d'attente dSe 

vide 3 :; ^ZS^SSF" 68 aUUe t " leS d ' aMen,e dU SyS,6me ' jUS ^ U ' a Ce V ,rouve une « la d ' a «ente non 
vide et dont la charge est superieure, a pnon, a un seui. determine Le choix d'une ,§che precise dans la file d'attente 

selecnonnee. s'etfectue selon un processus qui va etre detai..e ci-apres. De facon pratique, c'est .e ■dispatcher' qui 
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aussi calculfed chaque fois qu'une instruction d'ex^cution est inittee 

SfL^^^^^^" 1 Va " ab,e com P° srte comprenant des constantes (coef charge CPU et 
^JXS,^ P r Vent 6 StOCk ' GS danS Un8 VariabIe 9lobale el sont susceptible MtrB^ustSn^^) 
son 2ZS? n ^ f ° btenlr Un f6SUltat ° Ptimum - Les aulres compoeantes de la variable S 

f 8 "' en ,erme de tem PS calcul supplemental, est done n6g!igeab!e ttsposrttons propres a 

^ufL ,» t Ce qUi | CO " Cerne Particulferement les calculs permettant de determiner la charge d'une memoire il 
peut etre fat a ppe. a des methodes bien connues mettan, en oeuvre des algonthmes d'es,:mltion lineaTre ou non 

EftaL™ R^Jf Cr6at1 ' f'T w. OUVe " e * Che r - 61 Une ,ois due ,a fi,e d ' a,tent « ,a ™ins chargee a ete trouvee 
[0092] Ces depositions presentent de nombreux avantages. notamment les suivants . 

* el.es permettent de repondre tree rapidement a des modifications egalement rapides du comportement du sys- 

^SSSSUSST^ : " pourrait inclure d ' autre; variab,es - par exemp,e r6quilibra9e de la cha ^ de 

d/ le desequilibre dans des modules materiels est automatiquement pris en charge (e'est-a-dire le nombre de 
processeurs et/ou latai.le memoire) : en effet le nombre de processeurs es, pris en compte du fart que le P aTa„ c re 

duT^efn^^ 

du fait que le nombre de pages memoire (ou d'entrtes similaires) depend de la faille memoire ■ et 

mJL n^r 6 I aPte , ^ ' Ui " m6me aU j6U dG "^"rces : s'il exists plusieurs files d'attente partageant un 

- Z^l^^LT ar9e de la memoire est ,a m§me pour tous les - •* cfiTdS 

SESi L ' e * parie " ce montre <» ue ,es dispositions propres a cette premiere variants du second mode permettent 

tacourbl r ESS? Performances dun systeme non modifie, e'est-a-dire un systeme de .'art connu" 

£2i? 'onnement d'un systeme comportant les meme ressources informations mais dans leaCe, 

T P ? t reS 3 ' a Premi§re Variante du second mode de realisation d " P^ede de I CJZn im 

systeme est mo.ns performant qu'un systeme equivalent de Tan connu ' 
SLv^Sn" "nln 6 ' 6 ™ tiB " emenX ,ait W a * deuxl&me variante de realisation du second mode du precede 
ro^l r T V, : d,SpOS, "° ns s Peci«ques peuvent se cumuler avec celles de la premiere variante 
[0096] Conformement a cette deuxieme variante du second mode de realisation du precede selon .Mention lors 
qu un processeur constate que la file d'attente qui lui est associee est vide et qu'il devient inactif Tva Thercher una 

d^vLmt J^^T SCh6ma,i ^ uem er.t un mode de recherche possible dune tache dans les files d'attentes 
qu-en" tnTque de besoT m °™° et -ont re<fecrrts 

S!es na D r V^SS?! n™ 8 " 3 ^ 60 ^ de ,a U ^ re *■ ,es Processeurs emettent des requetes 

repues par le ditcher 3. On suppose ,ci que la file d'attente 5, du processeur 2, est vide et que celui-ci devtem 
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[0110] En ce qui conceme le choix cf une tache. un grand nombre de facteurs doivent etre pris en compte et parmi 
lesquels les suivants : K n««mi 

1/ faffinite avec un processeur. c'est-a-dire le fail que (a derniere distribution de ta tache s'est effectuee sur ce 
5 processeur ; 

2/ I'affinite avec un module, dans le cas d'une architecture de type D NUMA 0 , c'est-a-dire le fait que la derniere 
distribution de la tache s'est effectuee sur ce module ; 
3/ la priorite affects a une tache ; 
4/ la localisation de la tache ; 
10 5/ le fait que la tache ait deja ete °aidee n ; 

6/ le fait que le processus sort mono-tache ; 
II la quantite de memoire accedee par la tache ; 
8/ Putiiisation du processeur ; et 
9/ la duree de vie de la tache. 
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[01 1 1] En ce qui concerne le facteur 3/ (priorite), il est preferable de -sauter" les tache de plus haute priorite c'est- 
a-d.re les premieres taches dans la file d'attente "aidS". En effet, la probability est grande qu'elles soient prises en 
charge par un processeur local, du fait precisement de la haute priorite qui leur est associee, avant qu'elle puisse etre 
traits par le processeur eloigne. Utilisation d'un seuil predetermine semble etre une solution appropriee pour cette 
part.e du processus. En outre, les taches de plus faibles priorite son! generalement, en moyenne statistique, des laches 
qui utilisent le plus le processeur 

[0112] La determination d'une valeur de seuil est importante. En effet, si la valeur de seuil est trop basse c'est-a, 
d.re que le nombre de taches sautees est trop faible, le mecanisme d'aide se trouve alors souvent en conflit avec le 
mecanisme standard de distribution des taches. c'est-a-dire le mecanisme commun a I'art connu. En sens contraire 
s. le seuil est fcxe h une valeur trop haute, aucune tache ne pourra etre trouvee et le mecanisme d'aide s'avere com- 
pletement inefficace. 

[0113] De facon preferentielle pour etre aussi independant que faire ce peut de la charge de travail, on met en 
oeuvre un precede auto-adaptatif, par exemple le suivant : 

[0114] Le nombre de taches sautees est fixe a une valeur comprise entre le nombre de processeurs et le nombre 
de taches executables dans I'ensemble de file d'attente. Cette valeur est increments d'une unite chaque fois que la 
tache choisie pour etre "aidee" est, soit deja verrouillee, soit n'est pas a I'etat executable. Cette valeur est decrements 
d une unite chaque fois qu aucune tache n'est trouvee, lorsque le nombre maximum de taches k balayer est superieur 
a la moitie du nombre de taches executables. 

[0115] Le nombre maximum de taches a balayer est fixe h une valeur comprise entre I'unite et le nombre de taches 
executables dans I ensemble de file d'attente. Cette valeur est increments d'une unite chaque fois qu'aucune tache 
n est trouvee ou chaque fois que la tache choisie se trouve dans le dernier quart des taches balayees (taches de plus 
basses priontes). Cette valeur est decrements d'une unite chaque fois que la tache choisie se trouve dans le premier 
quart des taches balaySs (taches de plus hautes prioritS). premier 

2J 1 ? A G J aCteUr 4/ j ,oca,isation ) est ' a P*>ri. ^ facteur tres important. Cependant, ce facteur est generalement 
difficile a determiner, b.en que, dans un environnement de type "UNIX 0 , la localisation de la tache soit connue par 
segment de memoire. K 

[0117] En ce qui conceme le facteur 5/, on peut generalement admettre que, si une tache a deja ete "aidee" elle 
peut deja res.der dans plusieurs modules. II s'ensuit que de la deplacerailleurs ne constitue pas une operation couteuse 
en terme de degradation de performances. 

[0118] En ce qui concerne le facteur 7/. il s'agit egalement d'un facteur important, mais qui ne peut etre determine 
aisement. Deux cnteres permettent d'arriver a une approximation raisonnable : 

a/ la taille memoire utilisee par le processus ; et 

b/ Tinteractivite" de la tache, ce critere etant defini par le fait qu'une tache soit souvent "dormante" ou non. 

[01 1 9] Le critere b/ peut etre obtenu a partir d'un comptage du nombre de fois ou elle est a l'6tat "dormant" ce oui 
peut se denver de statistiques generalement disponibles. ' 
[0120] En ce qui concerne enfin le facteur 9/, il est aise de comprendre qu'il n'est pas utile de tenter de prendre en 
charge les taches de faible duree de vie. En effet, la plupart d'entre elles disparaissent k court terme 
[0121] En tenant compte de tout ou partie de ces difterents facteurs, il est possible de determiner quelle tache doit 
etre select.onnee dans une file d'attente, en definissant un cout indfviduel associ6 a chaque facteur et d'en deduire 
un cout global associe a une tache particuliere. On peut. pour ce faire construire une table * deux entrees ■ facteurs 
- couts. La tache presentant le cout global le plus faible est selectionnee, e'est^-dire celle causant la degradation 
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- si <K5LP-Adi < IgZJfl trouver la file d'attente d'indice arbrtraire y pour laquelle le parametre \\cTP - a3,'I est 
minimal ; " 

- migrer ce processus vers I'ensemble de file d'attente le moins charge 5 y : et 

- mettre a jour le jacteuj_representatif du desequilibre des deux ensembles de file d'attente. sort A3 = aD . 
s CLP X et AD y = ADy - CLP r * * 

[0134] Le vecteur de charge composite est un vecteur a trois dimensions. En effet, il depend des parametres 
suivants : Haa"=»«=» 

0 - charge du processeur ; 

charge de la memoire ; et 
priorite. 
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[01 3S] Les deux premiers parametres dependent a leur tour de la configuration materielle et logicielle precise du 
systeme considere : nombre de processeurs. taille de la memoire, nombre de pages memoire libres etc La determi- 
nation de ces parametres est commune a Tart connu et obtenue par des calculs classiques, biens connus de I'homme 
de metier. Le parametre "priorite" est obtenu a partir de la moyenne des priorites attachees aux differentes taches 
[01 36] Theonquement, la determination de la charge d'un ensemble de file d'attente est donnee par la somme des 
charges de processus. Mais pour accel6rer cette determination, on la derive directement a partir de statistiques qe- 
neralement slockees dans la structure de donnees de cet ensemble. La charge depend de nouveau de trois 
parametres : charge du processeur, charge de la m6moire et priorit6. 
[01 37] La determination de la charge composite moyenne peut Stre obtenue k partir de la relation suivante : 

ZcZ, 

ACL = ^ (3 ) 

P 

relation dans laquelle est la charge composite du ensemble de file d'attente et p le nombre total d'ensembles de 
file d'attente. 

[01 38] Le desdquilibre moyen peut etre determine a partir de la relation suivante : 

^ ^iD.^-lCL,) (4) 

[0139] La determination du cout associe a une operation de migration peut etre obtenue en considerant que le cout 
principal est du a la migration de pages de memoires, dans un environnement de type "UNIX" (ou a I'acces a des 
pages 6loign6es) et au coiit lie au deplacement d'une tache d'un ensemble de file d'attente a un autre 
[0140] Une approximation de I'estimation du cout est obtenue directement par le nombre de pages associees au 

^,t 8 . 8 M S !L P ! f 16 n ° mbre d9 {ScheS d8Vant ° Xre d< *lacees. Dans un environnement autre que ('environnement 
UNIX , I entit6 page de m6moire" doit etre remplacS par une entite Squivalente. 

[0141] Ces modes de determination des parametres impliques ne sont precises qu'a titre d'exemple, pour fixer les 
idees. D'autres alternatives existent et sont a la port6e de I'homme de metier. 

[0142] Si on se reporte de nouveau a la figure 8, la courbe C c illustre schematiquement I'allure de ('amelioration des 
performances par rapport a I'art connu (courbe C). Cependant, ('experience montre que, dans le cas general I'ame- 
horation obtenue par rapport a celle obtenue par la deuxifcme variante est peu importante. Ceci est du essentiellement 
au fart que le deplacement physique des taches entre files d'attente implique un cout non negligeable ce meme si 
celui-ci n'est pas generalise, conformement aux dispositions pr6f6rentielles qui viennent d'etre rappelees mais au 
contraire select.f. On reservera cette variante du P roc6d6 selon I'invention k une architecture de type "NUMA" car 
dans le cas d'une architecture classique de type "SMP", ('amelioration des performances n'est pas significative alors 
que sa mise en oeuvre nScessite des modifications du systeme d'exploitation et la presence d'organes supplementai- 
res, mat6riel ou logique (figure 7 . 8). 

[0143] A la lecture de ce qui precede, on constate aisement que I'invention atteint bien les buts qu'elle s'est fix6s 
[0144] II dort Stre clair cependant que I'invention n'est pas Iimrt6e aux seuls exemples de realisations explicitement 
decrrts, notamment en relation avec les figures 2 et 4 a 8. 



13 



EP 1 043 658 A1 



9. 



10 



de charge composite est calcule comma etant la somme de la charge d'un processes ou d'un groupe de oroces 
seurs associe a ladite file d'attente elemental et la charge des moyens de memoirs associes a ce processed 
ou ce groupe de processeurs. J 

Precede selon la revendication 6, caracterise en ce qu'il comprend une etape prealable consistant a tester si ladite 
nouvel e tache (Tz) est liee a une desdites files d'attente elementaires (5 a , 5, 5y) 5 p ) et en ce que lorsque ledit 
test est positrf a aiguiller ladite nouvelle tache vers cette file d'attente elementaire. 

Precede selon I'une quelconque des revendications 1 a 5. caracterise en ce qu'il comprend au moins une phase 
supplemental consistant, lorsque I'une desdites files d'attente elementaires (5.) associee a I'un desdits qroupes 
de processeurs (2,) est vide de taches executables, a rechercher une file d'attente elementaire (5 ) dite e'oicnee 
non VI de et dans cette file d'attente elementaire (5 y ) a selectionner une tache executable par I'un'desdits proces- 
seurs (2„) dudit groupe de processeurs associe a la file d'attente elementaire vide (5 0 ) et a la transmettre a ce 
processes (2,) pour y elre traitee. de maniere a equilibre globalement le traitement desdites taches dans ledit 
systeme (1). 

10. Procede selon la revendication 9, caracterise en ce que ladite file d'attente elementaire non vide (5„) dort presenter 
un seuil d'occupation minimal predetermine. y «*>»ruer 

20 11. Procede selon la revendication 1 0, caracterise en ce qu'en outre, les taches etant enregistrees par ordre de priorite 
decro.ssante. un nombre predetermine de taches est saute avant de balayer les autres taches de ladite file d'attente 
elementaire non vide (5 y ) pour rechercher une tache executable et la faire trailer par I'un desdits processeurs (2 ) 
dudit groupe de processeurs associe a la file d'attente elementaire vide (5,). 9 

2S 12. Precede selon la revendication 11 , caracterise en ce que ledit nombre do taches sautees et le nombre maximum 
de taches balayees parmi toutes celles enregistrees dans ladite file d'attente elementaire non vide (5 ) sont va- 
riables dans le temps et sont determines par un processus auto-adaptatif a partir du nombre de taches trouvees 
ou non pendant lesdits balayages et de la place de ces taches classees par ordre de priorite dans ladite file 
elementaire non vide (5^). 

Procede selon I'une quelconque des revendications 9 a 12, caracterise en ce que ladite tache selectionnee est 
ceMe assoc.ee k une valeur minimale d'un parametre dit de cout. mesurant la degradation de performances globale 
dud.t sys erne (1). due au traitement de ladite tache selectionnee dans ladite file d'attente elementaire eloignee 
non vide (5„) par I'un desdits processeurs dudit groupe de processeurs associe a la file d'attente elementaire vide 
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14. Procede selon I'une quelconque des revendications 1 a 5. caracterise en ce qu'il comprend au moins une phase 
supplemental comprenant au moins une etape de mesure periodique d'une repartition equilibree desdites taches 
dans lesdites files d'attente elementaires (5 a , 5,, 5y , 5 p ) et, lors de la determination d'un etat desequilibre dudit 
systeme (1), une etape de deplacement selectif de taches d'au moins une file d'attente elementaire plus charqee 
(5 X ) vers une file d'attente elementaire moins chargee (5 y ). 

15. Procede selon la revendicatbn 14, caracterise en ce que. lorsque ledit desequilibre est inferieur a un seuil deter- 
mine, aucun deplacement de tache n'est realise. 
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Procede selon les revendications 14 ou 15, caracterise en ce que tout ou partie desdites taches appanenant a 
des processus multitaches, chaque processus multitache necessitant une taille de memoire et une charge de 
travail determinees. il comprend une etape de mesure desdites charges de travail et desdites tallies de memoire 
en ce qu'.l comprend la selection du processus necessitant la plus forte charge de travail et la plus faible taille de 
memoire, et en ce que ce que toutes les taches dudit processus selectionne sont deplacees vers la file d'attente 
elementaire la moins chargee (5 y ). 

1 7. Procede selon la revendication 1 6, caracterisd en ce qu'il comprend une etape preliminaire consistant a tester si 
toutes les taches dudrt processus multitache devant dtre deplacees appartiennent a I'ensemble de file d'attente 
elementaire le plus chargd (5 X ) et si aucune tache n'est liee a I'un desdits groupes. 

18. Procede selon I'une quelconque des revendications 1 a 17, caracterise en ce que ledit systeme d'exploitation est 
du type UNIX (marque deposee). 
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